干货|手把手教你代谢组学原始数据如何上传!
MetaboLights 是欧洲生物信息研究所(EMBL-EBI)旗下的代谢组学实验和衍生信息的数据库。MetaboLights 目前是主流代谢组学期刊推荐的代谢组学数据存储和分享数据库,该数据库内容丰度,涵盖代谢物结构及其参考光谱以及它们的生物学作用、位置和浓度,以及代谢实验的实验数据等。如果没有实际做过代谢组项目,也可根据研究方向从MetaboLights数据库下载相关代谢组原始数据进行研究和代谢组论文发表。接下来我们将一起体验如何一步步上传我们的代谢组学原始数据到MetaboLights数据库上。
根据经验,MetaboLights 上传数据流程较复杂,过程比较耗时,建议使用谷歌浏览器,以及找网速相对较好的位置。在传输过程中,这个网站同步数据相对迟缓,可能某些步骤卡顿,建议耐心等待。
MetaboLights 官网网址:https://www.ebi.ac.uk/metabolights/
(复制链接至浏览器打开或点击阅读原文)
本文会详解数据上传流程和方法,关于具体的数据上传步骤也可参考官方英文视频介绍:
https://www.ebi.ac.uk/metabolights/help
点击Login进行注册
点击Create an account创建账户
输入邮箱、名、姓、密码、国家、单位等,勾选同意条款,最后点击Creat。
几分钟后,邮箱会收到一封MwtaboLights的邮件,点击激活,输入账号密码登录。
点击Create New Study及以下操作来创建Study(值得注意的是,一个代谢组项目创建一个Study,如文章中涉及多个代谢组项目数据,一定要创建多个Study来上传)。之后MetaboLights会分配study id,该id唯一,作为数据上传的标识写入文章。
如图是韩群花等人发表则在Aging Cell杂志中上传的代谢组学数据叙述,该文章涉及到两个代谢组项目。
进入创建的study,Upload files为数据上传页面,可先跳过,第3部分会详细叙述。
需要填写项目发表文章的关键词、标题、摘要、文章状态等。
点击Add technique来创建。需要根据项目实际情况来选择,联川生物目前LC-MS代谢组项目统一采用如下选择,有pos和neg两种检测模式(GC-MS项目较少见,一般只采用pos检测模式,需要根据实际项目来选择),创建两个ASSAY type。
点击Add/edit details来进行之后填写。
在Protocols页面样本采集、代谢物提取、色谱分析、质谱分析、下机数据质控和处理、代谢物鉴定等步骤的叙述,具体可参考公司给的实验和分析方法部分。
之后根据填写经验,无需在网页上填写此五个页面,直接在Sample Details、Assay details、Metabolite annotation页面下载(一个项目共五个表格,pos和neg检测模式各一张Assay details、Metabolite annotation表格,两种模式共用一个sample表格)对应表格来填写即可。
Sample表格:
一般需填写如下标黄列:
(点击图片放大查看)
各列信息:
Source Name:样本的原始数据名称(不区分pos、neg。如treat1样本原始数据为pos_1.raw和neg_1.raw,则填写1.raw)
Characteristics[Organism]:样本物种来源
Characteristics[Organism part]:样本的物种组织来源
Characteristics[Sample type]:样本具体类型(QC样本:pooled sample;实验样本根据实际情况填写)
Protocol REF:一般填写Sample collection
Sample Name:样本名称(不区分pos、neg。如文章中命名为treat1样本,则填写treat1即可)
Assay 表格:
需填写如下标黄列:
(点击图片放大查看)
各列信息:
Sample Name:样本名称(不区分pos、neg。如文章中命名为treat1样本,则填写treat1即可)
Protocol REF:协议参考,一般填写Extraction
Parameter Value[Post Extraction]:参数值[提取后]:样本具体制备(联川生物一般QC样本:QC samples were prepared by combining 10 μL of each extraction mixture;实验样本:The samples were extracted from 20 μL of sample using 120 μL of precooled 50% methanol buffer)
Protocol REF:色谱协议参考:一般填写Chromatography
Parameter Value[Chromatography Instrument]:色谱仪器型号
Parameter Value[Column type]:色谱原理类型,一般使用reverse phase
Protocol REF:质谱协议参考,一般填写Mass spectrometry
Parameter Value[Scan polarity]:质谱检测模式,正负模式分别填写postive、negative
Parameter Value[Scan m/z range]:参数值[质谱扫描m/z范围],根据具体实验方法填写,一般为from 60 to 1200
Parameter Value[Instrument]:质谱仪器型号
MS Assay Name:原始数据名称(区分pos、neg。如treat1样本原始数据为pos_1.raw和neg_1.raw,则两张Assay 表格分别填写pos_1.raw和neg_1.raw)
Raw Spectral Data File:原始数据类型,如Thermo的QE质谱仪为raw格式、AB Sciex 的TripleTOF系列质谱仪为wiff.scan格式
Protocol REF:数据协议参考,一般填写Data transformation
Derived Spectral Data File:派生的光谱数据文件,QE质谱仪只有raw文件,无派生的光谱数据文件,不填写;TripleTOF系列质谱仪有派生的光谱数据文件,为wiff格式。
Protocol REF:代谢物鉴定数据协议参考,一般填写Metabolite identification
Metabolite Assignment File:代谢物分配文件,下载表格下拉复制即可。需要注意项目名称,如id为MTBLS2849,negative模式填写:m_MTBLS2849_LC-MS_negative_reverse-phase_metabolite_profiling_v2_maf.tsv
Metabolite 表格:
需填写如下标黄列:
(点击图片放大查看)
各列信息:
database_identifier:代谢物对应的数据库注释ID,如Acetaldehyde对应HMDB id为HMDB0000990
chemical_formula:代谢物化学式,如Acetaldehyde为C2H4O
metabolite_identification:代谢物名称,如填写Acetaldehyde
mass_to_charge:代谢物的对应代谢离子质荷比,如某项目中Acetaldehyde为89.02383389
retention_time:代谢物的对应代谢离子的色谱保留时间,如某项目中Acetaldehyde为1.362933333
另外需要在最后添加上鉴定到代谢物在各样本中丰度值,可根据实际样本数据来增加列数,如下图
Metabolights官网给了两种代谢组数据上传的方法。其中Aspera上传,可细分为两种方式进行,一种是通过piugin插件,可以通过网页来传输,点击Install plugin,按照提示一步步操作即可,但中间在安装扩展和Connect可能无法访问国外服务器,失败可能性较大。另一种是通过指令传输,点击Aspera Command line client可以看到每步具体指令,此种方式传输稳定,且速度较快,但需要一定的linux基础,有一定难度。
重点推荐大家通过FTP方式来传输。
建议大家网上下载免费开源的FTP软件FileZilla。FileZilla为专业的数据传输软件,界面操作简单,已被汉化,开源免费,不仅可以传输代谢组数据至Metabolights数据库,还可上传RNA-seq数据至GEO数据库等。
2)之后点击Private FTP Upload可查看该项目登录FTP的服务器、账号、密码、以及上传路径等
填写主机、账号、密码后点击快速连接即可登录。
FileZilla界面如下以及操作如下:
将Remote folder路径粘贴至远程站点,即可链接上Metabolights数据库。再将需要上传的代谢组原始数据以及填写后的Sample表格、Assay 表格、Metabolite 表格等全部内容拖至此路径下即可传输。
检查数据传输情况。
FileZilla界面最下方显示具体传输情况,检查是否有因网络问题没有传输成功的文件。
检测具体填写错误
数据全部传输完成,以及文章标题、作者、项目的实验方法、分析方法等全部填写完毕后,点击Study overview后进入检查页面,点击页面各项可检测已填写的各项内容。
如果检测页面有Validation:Failed显示,说明数据传输或填写中有错误。点击Study validation,选择Errors查看具体错误,返回修改并重新上传。需要注意的是,Metabolights网站刷新可能较慢,新的传输可能一段时间后才能同步上去,需要多刷新几次。
根据经验,可选中要删除的错误文件,进行强制删除。
并将正确的文件选中后进行强制同步。
最后,无Validation:Failed显示,说明传输无错误。点击Release Date可以根据需求修改公开数据的日期。
用户文章|IF=9.7,代谢组学揭示TFE3融合介导的NMRK2上调是Xp11.2 易位肾细胞癌能量代谢适应的关键
用户文章∣IF=8,代谢组学+微生物揭示挥发性DMNT保护植物抗小菜蛾侵害的作用机制-代谢组学专题
点击下方图片进入云平台资料汇总:
所见即所得,绘图高规格联川云平台,让科研更自由